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摘 要 虽然 操纵 检验 是 保证 实验 构 念 效 度 的 重要 方式 ， 但 国内 管理 心理 学 者 对 其 方法 层面 


的 探讨 较 少 。 基 于 此 ， 本 研究 在 归纳 了 操纵 检验 主要 用 途 的 基础 上 ， 对 国内 2020 年 《心理 


学 报 》《 心 理科 学 》《 管 理 世 界 》《 南 开 管理 评论 》 这 四 本 期 刊 中 涉及 管理 心理 实验 的 49 
篇 论文 、144 项 实验 进行 了 编码 分 析 ， 从 操纵 检验 的 关键 设计 环节 总 结 了 国内 管理 心理 领域 
操纵 检验 的 使 用 现状 、 问 题 及 其 应 对 策略 。 研 究 发 现 ， 国 内 操纵 检验 实施 形式 单一 ， 以 自 报 
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告 式 操纵 检验 为 主 , 很 少 关注 辨别 式 操纵 检验 和 指导 式 操 纵 检验 , 且 对 操纵 检验 的 位 置 设计 、 


实施 时 机 和 分 析 人 策略 重视 度 不 够 。 未 来 研究 者 应 当 注 重 通 过 非 干预 形式 减少 操纵 检验 对 实验 


进程 的 干扰 , 实施 误差 控制 策略 排除 无 效 检 验 和 竞争 性 解释 , 根据 操纵 检验 特性 决定 其 在 实 


验 材料 中 的 位 置 , 借助 事前 和 事后 操纵 检验 实现 检验 时 机 的 灵活 性 , 开展 操纵 强度 和 中 介 分 
析 提 升 实验 内 外 部 效 度 ， 从 而 提升 实验 操纵 检验 的 规范 性 。 
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LE 实验 ， 直 接 操纵 检验 ， 辨 别 式 操纵 检验 ， 指 导 式 操纵 检验 


实验 研究 通过 操纵 自 变 量 ， 分 析 其 对 因 变 量 的 影响 ， 确 定 构 念 间 的 因果 关系 (Rogers & 
Révész, 2019; Sigall et al., 1998)。 在 管理 心理 研究 中 ， 员 工 或 消费 者 的 心理 状态 是 主要 的 研 


REE, 但 是 实验 者 一 般 不 能 直接 改变 这 些 变 量 , 需要 一 些 精妙 的 实验 设计 来 间接 操纵 这 些 


心理 因素 。 因此 ， 


只 有 实验 成 功 操纵 了 预想 的 自 变量 , 才能 证 明 预 设 的 因果 假设 (Wilson etal., 


2010)， 这 就 要 求实 验 设计 者 保证 实验 操纵 的 有 效 性 。 操 纵 检验 (manipulation checks) 是 评 


估 实 验 操纵 有 效 


本 技术 (Bjel6v 及 Luke, 2020)。 一 般 而 言 ， 操 纵 检验 通过 对 所 操纵 变量 及 相关 因素 的 测量 


性 的 重要 途径 ， 是 保证 实验 构 念 效 度 的 重要 手段 , 被 视 为 现代 心理 实验 的 基 
* 


保证 实验 成 功 操纵 了 预期 变量 (Hauser et al., 2018)。 该 方法 也 受到 实验 研究 者 的 广泛 使 用 ， 
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过 去 发 表 在 心理 领域 国际 顶级 期 刊 的 实验 研究 中 超过 50% 的 实验 报告 了 操纵 检验 结果 


(Hauser et al., 2018; Sigall et al., 1998)， 不 少 研究 强调 操纵 检验 是 实验 严谨 性 的 象征 (Fayant et 


al., 2017; Haslam & McGarty, 2014). 

虽然 操纵 检验 拥有 诸多 优势 , 受到 广泛 重视 , 但 直到 近年 来 才 有 学 者 关注 操纵 检验 的 使 
问题 。 比 如 ， 近 期 国外 社会 心理 学 领域 的 研究 者 曾 探讨 实验 操纵 的 构 念 效 度 问 题 (Chester 
& Lasko, 2021) 和 操纵 检验 统计 使 用 问题 (Ejel6v & Luke, 2020)。 这 些 研 究 一 致 认为 不 良 的 操 
纵 检验 会 对 实验 产生 干扰 , 可 能 会 盲目 地 增强 研究 者 对 研究 结果 的 信心 , 影响 实验 结果 的 可 
信 度 (Fayant et al., 2017; Hauser et al., 2018)。 然 而 ， 这 些 研究 并 未 从 操纵 检验 设计 的 关键 环 
节 进 行 细致 的 现状 与 问题 总 结 ， 并 给 出 有 针对 性 的 应 对 策略 。 

反观 国内 , 当下 主流 实验 方法 类 著作 主要 关注 实验 法 的 整体 实施 设计 , 实验 方法 类 论文 
则 主要 关注 实验 流程 与 数据 分 析 (e.g., Kiiza, 郭 昭君 , 2019; 方 杰 , WER, 2018; AME 
等 , 2021; 李 晓 倩 ， 马 亮 ,2021; 柳 武 妹 等 ,2020; EBH, WER, 2018)， 鲜 有 文章 讨论 操纵 检 
验 的 具体 设计 细节 ， 以 及 各 类 操纵 检验 的 使 用 问题 和 规避 举措 。 这 可 能 会 导致 不 少 学 者 在 操 
纵 检 验 设计 过 程 中 缺乏 依据 ， 甚 至 会 依靠 片面 的 理解 进行 主观 设计 ， 得 出 有 偏 的 实验 结论 。 
以 操纵 检验 的 位 置 为 例 ， 较 多 国内 实验 研究 会 将 操纵 检验 前 置 〈 即 放 于 因 变 量 前 )， 但 其 中 
鲜 有 研究 讨论 操纵 检验 前 置 是 否 会 对 实验 进程 产生 干扰 的 问题 。 除 此 之 外 , 较 多 国内 实验 研 
究 也 并 未 讨论 实验 操纵 引发 的 竞争 性 解释 ， 比 如 刘 咏 梅 等 2015) 通 过 电脑 和 牙膏 来 操纵 产品 
的 感知 风险 ， 并 通过 操纵 检验 验证 了 操纵 结果 的 有 效 性 。 然 而 ,他们 的 实验 操纵 中 存在 竞争 
性 解释 ， 比 如 电脑 和 牙膏 也 代表 不 同 价格 、 不 同 用 途 、 不 同 决策 复杂 性 的 产品 ， 这 些 都 会 对 
实验 结果 产生 影响 。 在 他 们 的 实验 中 ， 由 于 不 能 排除 上 述 竞 争 性 解释 ,这 就 可 能 导致 有 偏 的 
实验 结论 。 因 此 ， 有 必要 对 操纵 检验 设计 问题 进行 汇总 讨论 ， 为 实验 研究 者 提供 参考 。 

为 了 有 效 提升 国内 操纵 检验 应 用 的 规范 性 , 本 研究 通过 操纵 检验 文献 的 回顾 和 使 用 现状 
的 编码 分 析 ， 总 结 了 我 国 管理 心理 实验 中 操纵 检验 的 使 用 现状 、 问 题 和 应 对 策略 。 在 展示 了 
操纵 检验 的 类 型 及 其 基本 用 途 后 ,本 研究 基于 4 本 国内 管理 心理 权威 期 刊 2020 年 发 表 的 144 
项 实验 研究 的 编码 数据 , 对 国内 管理 心理 领域 操纵 检验 具体 使 用 情况 进行 总 结 , 并 针对 具体 
问题 提出 建议 。 本 研究 有 助 于 发 现 和 解决 操纵 检验 使 用 中 的 潜在 问题 , 对 提升 管理 心理 实验 


的 规范 性 具有 重要 意义 。 
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2 操纵 检验 的 用 途 


操纵 检验 是 保证 实验 构 念 效 度 的 基本 方法 。 
操纵 能 对 预期 的 构 念 产生 影 


1957; Chester & Lasko, 


i 


研究 者 使 月 
响 , 同时 对 无 关 构 念 不 产生 影响 , 以 确 
2021)。 根 据 用 途 的 不 同 ， 操 纵 检验 可 具 


操纵 检验 的 主要 目的 是 保证 实验 


保 实验 构 念 
本 分 为 直接 操纵 检验 (direct 


385 (Campbell, 


manipulation checks)、 辨 别 式 操纵 检验 (discriminant manipulation checks)、 指 导 式 操纵 检验 


(instructional manipulation checks) 等 形式 (Ejel6v & Luke, 2020)， 表 1 总 结 了 各 类 操纵 检验 的 


含义 和 主要 用 途 。 合 理应 用 不 同类 


型 的 操纵 检验 可 以 从 不 同 角度 保证 实验 操纵 的 有 效 性 。 


表 1 操纵 检验 的 用 途 
操纵 检验 类 型 AX ji 
> 直接 操纵 检验 。 ”测量 预期 变量 水 平 检验 实验 操纵 是 否 激活 了 预期 变量 的 问题 
辨别 式 操纵 检验 测量 竞争 性 解释 变量 检验 和 控制 实验 操纵 所 引发 的 竞争 性 解释 
指导 式 操纵 检验 ”通过 客观 题目 测验 被 试 是 否认 真 填 答 排除 失真 数据 
了 首先 ,直接 操纵 检验 是 较为 传统 的 检验 形式 ,主要 关注 实验 操纵 是 否 激活 了 预期 变量 的 
am FI. 在 实际 使 用 中 ,直接 操纵 检验 仅 涉及 所 操纵 的 变量 ， 通 过 对 比 实 验 组 和 控制 组 操纵 检 


其 次 ,辨别 式 操纵 检验 主要 测量 


的 差异 , 来 判断 操纵 是 否 激活 了 预期 构 念 。 两 者 有 显著 差异 就 
期 构 念 有 影响 ， 差 异 越 大 则 代表 操纵 强度 越 大 (Festinger, 1953). 


量 与 操纵 相关 的 


的 竞争 性 解释 。 随 着 学 


界 对 实验 操纵 


竞争 性 解释 


构 念 以 外 的 其 他 变量 。 实 验 ， 
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他 因素 (Sigall et al., 1998)， 比 如 实验 操纵 被 拒绝 感 时 ， 
悲伤 情绪 的 影响 ， 此 时 悲伤 情绪 便 是 被 了 
争 解释 的 操纵 , 研究 者 采用 了 辨别 式 操纵 检验 控制 


因 变 量 会 受到 


m 


的 其 他 心理 状态 


>， 继 而 进行 协 变量 
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2020; Lench et al., 2014). 


随 着 文本 操纵 和 在 线 实验 等 的 兴起 , 如 何 确保 被 试 认真 参 
新 挑战 (Kotzian et al., 2020; Oppenheimer et al., 2009)。 在 缺乏 高 强 

下 ， 研 究 者 不 仅 要 保证 实验 操纵 自身 的 有 效 性 ， 
(Parigietal,2017)。 被 试 未 认真 填 答 而 产生 的 失真 数据 


再 次 , 指导 式 操纵 检验 主要 通 
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iacit 


他 变量 , 用 于 检验 和 控 币 
重视 度 提高 ,操纵 检验 还 
性 解释 是 指 实验 操纵 引发 的 会 对 实验 结果 产生 干扰 的 其 


介 分 析 ， 


可 能 同时 激活 了 被 试 的 悲伤 情 


明 实 验 操纵 确实 对 预 


1 实验 操纵 引发 
不 涉及 到 除 预 期 


绪 ， 而 


ELE 


争 性 解释 。 对 于 一 些 


S IA 


和 通过 测量 实验 操纵 引发 


通过 


UHER EG 


性 假设 (Ejelöv & Luke, 


过 客观 题目 来 测验 被 试 是 否认 真 填 答 ， 


— 


j 于 排除 失真 数据 。 


还 要 考虑 


被 试 是 否 集中 注 


会 对 实验 结果 产生 干扰 ， 因 


与 实验 成 为 保证 实验 操纵 有 效 性 的 


度 刺 激 和 现场 监督 的 条 件 
ERA, WKS 
此 研究 者 


有 必要 在 数据 分 析 时 对 其 进行 排除 。 然 而 ， 被 试 对 实验 操纵 的 反应 具有 主观 性 ， 传 统 操 纵 检 


验 结果 的 异常 并 不 能 代表 被 试 未 认真 填 答 ,不 能 成 为 排除 失真 数据 的 依据 。 此 时 ， 有 学 者 提 


被 试 填 答 一 些 简 单 的 问题 ， 如 算术 题 )、 陷 阱 式 操纵 检验 〈 如 要 求 被 试 跳 过 特定 题目 或 选择 


出 通过 指导 式 操纵 检验 ， 可 以 有 效 排除 被 试 未 认真 填 答 产生 的 实验 数据 ， 保 证 操纵 有 效 性 。 
指导 式 操 纵 检验 具有 多 种 形式 ， 比 如 刺激 检测 〈 让 被 试 回忆 实验 基本 信息 ) 注意 力 检 测 (让 


特定 选项 ) (Ejelöv & Luke, 2020; Paas et aL, 2018)。 与 传统 操纵 检验 中 自 变 量 的 感知 测量 相 
Lh, 指导 式 操 纵 检验 具有 客观 的 答案 ， 如果 被 试 没有 正确 回答 测试 注意 力 的 题 项 , 一 定 程度 
上 就 可 以 证 明 被 试 未 认真 作答 。 基 于 此 ， 有 学 者 把 指导 式 操纵 检验 也 纳入 操纵 检验 概念 中 


(Hauser et al., 2018; Oppenheimer et al., 2009). 


3 国内 管理 心理 实验 中 的 操纵 检验 使 用 现状 与 问题 
本 部 分 以 操纵 检验 设计 中 的 关键 环节 为 基本 框架 ， 通 过 对 国内 管理 心理 领域 的 4 本 权 


威 期 刊 2020 年 发 表 的 实验 类 文章 进行 编码 分 析 ， 探 讨 我 国 管理 心理 领域 操纵 检验 使 用 现状 


及 问题 。 


3.1 研究 方法 
3.1.1. 文献 搜索 策略 及 纳入 标准 


为 了 精准 捕捉 操纵 检验 最 新 使 用 现状 ， 本 研究 选取 了 《管理 世界 》《 南 开 管 理 评论 》、 
《心理 学 报 》《 心 理科 学 》4 本 管理 心理 领域 的 权威 期 刊 上 2020 年 发 表 的 管理 心理 实验 论 
文 为 研究 对 象 ,两 位 编码 者 通过 浏览 每 篇 论文 的 内 容 , 并 以 “组织 行为 学 "“ 消 费 者 行为 学 ” 


“工业 与 组 织 心 理学 ”等 相关 领域 的 主题 为 得 选 标准 开展 筛选 工 作 。 结果 显示 , 这 些 期 刊 2020 


年 发 表 的 585 篇 论文 中 有 107 篇 属于 管理 


验 相 关 的 关键 词汇 作为 筛选 标准 ， 本 研究 


心理 领域 。 以 “实验 ”"“ 预 实验 “操纵 检验 ”等 实 


筛选 出 49 篇 涉及 实验 研究 设计 的 论文 ， 其 中 


Dh 


在 四 本 所 选 期 刊 中 ， 有 接近 一 半 的 管理 心理 


理 世 界 4 篇 , 南开 管理 评论 16 篇 , 心理 学 报 17 篇 , 心理 科学 12 篇 。 从 以 上 数据 可 以 看 到 ， 


理 心理 文章 中 使 用 实验 法 的 论文 最 多 ， 占 比 高 达 74%。 算 选 出 的 49 篇 论文 中 共 涉 及 152 T 


Dh 


究 采 用 了 实验 法 验证 假设 , 《心理 学 报 》 的 


=H 


子 研究 ， 其 中 实验 研究 为 144 项 ， 非 实验 研究 为 8 项 。 其 中 ，78% 的 实验 涉及 了 操纵 检验 ， 


MA 22% 的 实验 未 进行 操纵 检验 ， 这 说 明 当 下 实验 研究 对 操纵 检验 的 重视 度 较 高 。 


3.1.2 编码 内 容 


本 研究 对 管理 心理 实验 中 操纵 检验 关键 设计 环节 做 了 具体 分 析 。 具 体 而 言 , 我们 从 操纵 


检验 的 实施 形式 、 误 差 控 制 、 位 置 设计 、 实 施 时 机 、 分 析 策 略 等 方面 总 结 了 国内 管理 心理 领 


域 操纵 检验 的 使 用 现状 、 问 题 及 其 应 对 策略 。 其 中 ， 实 施 形式 侧重 于 如 何 (how) 开 展 操纵 检 
验 ， 误 差 控 制 侧重 于 实验 操纵 检验 什么 (what)， 位 置 设计 侧重 于 操纵 检验 放 在 哪里 (where)， 
实施 时 机 侧重 于 何 时 (when) 开 展 操纵 检验 ， 分 析 策 略 侧 重 于 操纵 检验 是 否 (whether) 成 功 。 
3.1.3 编码 的 一 致 性 信和 度 

为 了 更 好 地 提升 编码 质量 ,本 研究 由 两 位 编码 者 共同 编码 ,并 通过 对 比 二 者 编码 的 一 臻 
性 来 保证 编码 的 有 效 性 。 我 们 采用 Kappa 一 致 性 信 度 计算 公式 ， 求 得 两 位 编码 者 的 编码 一 
致 性 信和 度 为 0.983。 此 外 ， 我 们 也 采用 了 概率 的 方式 计算 出 编码 一 致 性 比例 为 97.8%。 对 于 
不 一 致 的 编码 ， 由 编码 者 解释 说 明 编 码 原因 ， 通 过 小 组 讨论 达成 一 致 。 
3.2 操纵 检验 实施 形式 的 现状 、 问 题 与 应 对 策略 
3.2.1 操纵 检验 实施 形式 的 现状 

从 理论 上 来 讲 ， 操 纵 检验 具有 多 种 开展 形式 ， 包 括 自我 报告 、 行 为 测量 、 生 理 测 量 、 观 


察 测量 、 言 语 测量 编码 分 析 等 。 我们 对 管理 心理 实验 研究 的 操纵 检验 实施 形式 进行 了 编码 分 
析 。 结 果 显 示 ， 采 用 了 操纵 检验 的 实验 研究 都 使 用 了 自我 报告 的 方法 检验 操纵 的 有 效 性 ， 仅 
有 2 项 实验 在 自我 报告 操纵 检验 的 基础 上 ， 还 通过 定性 编码 〈 对 实验 中 产生 的 回忆 材料 ) 的 
方式 检验 操纵 有 效 性 。 与 Chester 和 Lasko(2021) 基 于 国际 期 刊 社会 心理 实验 的 统计 相 比 ， 国 
内 管理 心理 实验 几乎 全 部 使 用 了 自我 报告 式 操纵 检验 ， 而 国际 心理 实验 中 有 17.32% 使 用 定 
性 行为 编码 、 生 理 测量 等 非 干预 式 操纵 检验 。 


3.2.2 操纵 检验 实施 形式 的 问题 
与 国际 心理 学 权威 期 刊 的 实验 相 比 , 国内 管理 实验 领域 采用 自我 报告 式 操纵 检验 的 比例 


更 高 , 而 这 种 类 型 的 操纵 检验 对 实验 进程 的 干扰 会 会 明显 高 于 行为 、 生 理 测量 等 非 干 预 式 操 
纵 检验 方法 (Webb et al., 1966)。 自 我 报告 这 种 直观 且 具 有 强 暗示 性 的 测量 会 向 被 试 传递 一 些 
额外 信息 , 会 使 被 试 产生 诸如 “为 什么 研究 者 会 关心 这 个 问题 "的 疑问 , 影响 被 试 后 续 的 填 答 ， 
甚至 会 改变 被 试 自身 的 反应 策略 (Hauser & Schwarz, 2015)。 对 被 试 而 言 ， 自 我 报告 式 操纵 检 
验 显然 是 一 个 有 可 能 会 透露 潜在 实验 目的 的 环节 , 会 自然 地 引发 被 试 对 操纵 检验 的 解读 
考 ， 进 而 干扰 实验 结果 (Wilson et al., 2010)。 比 如 Keltner 等 (1993) 发 现 悲伤 会 降低 人 们 对 总 
体 生 活 满意 度 的 感知 ,但 如 果 让 被 试 在 悲伤 操纵 后 报告 其 悲伤 程度 ， 悲 伤 操纵 与 生活 满意 度 
之 间 的 效应 会 消失 。 与 此 相似 ，Kassam 和 Mendes(2013) 发 现 要 求 被 试 评估 自身 愤怒 水 平 会 
改变 愤怒 操纵 对 心血 管 反 应 的 影响 程度 。 


3.2.3 操纵 检验 实施 形式 的 应 对 策略 
非 干 预 式 操纵 检验 形式 是 解决 自我 报告 式 操纵 检验 干扰 实验 进程 的 重要 策略 (Hauser, 


2018)。 非 干扰 式 操纵 检验 方式 的 基本 逻辑 是 实验 操纵 所 引发 的 被 试 心理 变化 会 影响 被 试 后 
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续 的 行为 《例如 操纵 困难 度 会 影响 反应 速度 ) (Curran,2016)、 生 理 反 应 《例如 操纵 愤怒 影响 
心率 、 血 压 、 面 部 表情 )、 言 语 表现 《例如 操纵 负面 情绪 影响 被 试 积极 或 消极 词汇 使 用 )， 而 
对 这 些 外 部 表现 的 测量 可 以 反映 实验 操纵 效果 (Word et al., 1974)。 然 而 ， 不 论 是 国内 还 是 国 
际 期 刊 , 采用 非 干预 式 操纵 检验 的 实验 比例 相对 较 低 , 产生 这 种 现象 的 主要 原因 是 此 类 操纵 
检验 的 可 行 性 问题 。 首先 ， 并 非 所 有 的 操纵 都 能 引发 被 试 明 显 的 反应 ， 有 些 自 变量 涉及 的 心 
理 状态 难以 被 观察 , 在 这 种 情况 下 非 自 我 报告 的 操纵 检验 作用 就 比较 有 限 。 其 次 , 进行 观察 、 
生理 或 行为 检验 可 能 会 需要 一 些 录像 、 生 理 检 测 等 设备 ， 需 要 较 高 的 实验 成 本 。 基 于 这 两 点 

考虑 ， 不 少 研究 从 操纵 检验 位 置 、 时 机 等 方面 寻找 减 小 操纵 检验 对 被 试 影响 的 方法 。 

3.3 操纵 检验 误差 控制 的 现状 、 问 题 与 应 对 策略 

3.3.1 操纵 检验 误差 控制 的 现状 
pe 实验 研究 者 通常 希望 因 变 量 的 变化 完全 是 由 实验 操纵 造成 的 ， 但 在 实验 实施 的 过 程 中 ， 
可 能 会 存在 一 些 额 外 变量 造成 因 变量 的 变化 。 这 些 额外 变量 可 能 是 随机 的 , 也 可 能 是 系统 性 
的 。 随 机 的 额外 变量 会 引发 随机 误差 ， 往 往 很 难 消除 ， 主 要 依靠 采纳 成 熟 的 操纵 检验 量 表 、 
采纳 多 题 项 操纵 检验 量 表 、 吻 除 不 认真 填 答 者 等 方式 加 以 控制 。 系统 的 额外 变量 往往 会 引发 
系统 误差 ， 这 种 误差 是 实验 操纵 的 竞争 性 解释 ， 往 往 需 要 通过 辨别 式 操纵 检验 进行 排除 。 

针对 操纵 检验 随机 测量 误差 控制 问题 ,我 们 统计 了 操纵 检验 量 表 的 使 用 情况 。 结 果 显示 ， 
113 项 使 用 了 操纵 检验 的 实验 中 ， 有 接近 一 半 的 实验 (51 项 ) 使 用 简单 自 创 的 方式 进行 操纵 
检验 ， 并 未 使 用 成 熟 量 表 进 行 操纵 检验 ， 只 有 46 项 实验 完全 规范 使 用 成 熟 量 表 进 行 操纵 检 
验 。 从 操纵 检验 测量 题 项 的 数量 来 看 , 有 55 项 实验 完全 采用 了 多 题 项 进行 操纵 检验 (49%)， 
略 高 于 Chester 和 Lasko(2021) 统 计 的 国际 社会 心理 实验 单 题 项 操纵 检验 比例 (35%)。 针 对 
被 试 不 认真 填 答 的 误差 控制 问题 , 我们 对 实验 中 的 样本 排除 策略 进行 了 编码 分 析 。 统计 结果 
显示 , 一 共有 70 项 实验 涉及 了 无 效 样本 排除 。 其 中 ， 有 19 项 采用 了 指导 式 操 纵 检验 排除 无 
效 样本 ， 有 34 项 实验 使 用 “ 乱 填 *"、“ 未 完成 回忆 任务 ”等 理由 论证 被 试 并 未 认真 填 答 问 卷 ， 
而 西方 文献 中 使 用 指导 式 操纵 检验 排除 无 效 样本 的 比例 更 高 (Ejel6v & Luke, 2020)。 针 对 竞 
争 性 解释 的 系统 误差 控制 问题 , 我 们 统计 了 辨别 式 操纵 检验 的 使 用 情况 。 统 计 结 果 显 示 ， 辩 
别 式 操纵 检验 并 未 被 广泛 采用 , 绝 大 多 数 实验 仅 使 用 了 直接 操纵 检验 来 保证 操纵 有 效 性 。 涉 
及 辨别 式 操纵 检验 的 实验 共有 38 项 ( 占 含 操纵 检验 实验 的 34%)， 涉 及 率 (17%) 高 于 西方 
社会 心理 领域 。 
3.3.2 操纵 检验 误差 控制 的 问题 
与 国际 心理 学 权威 期 刊 的 实验 相 比 , 国内 管理 心理 实验 在 操纵 检验 测量 误差 控制 和 排除 


竞争 性 解释 方面 表现 更 优 , 但 对 指导 式 操 纵 检验 等 新 兴 的 操纵 检验 方法 的 使 用 率 不 高 。 存 在 
误差 的 操纵 检验 无 法 保证 实验 操纵 的 构 念 效 度 (Bless & Burger, 2016; Hauser et al., 2018; 
Kiihnen,2010)。 首 先 ， 不 准确 的 操纵 检验 测量 会 产生 有 偏 的 结论 。 在 部 分 情境 下 ， 操 纵 检验 
结果 的 组 间 差 异 有 可 能 并 非 实验 操纵 导致 , 而 是 由 一 些 外 部 干扰 导致 ， 比 如 被 试 未 认真 填 管 
形成 的 数据 失真 以 及 应 用 非 成 熟 测 量 造 成 的 测量 误差 等 (Chester & Lasko, 2021)。 如 果 不 对 这 
些 误 差 进 行 控制 ,往往 会 导致 操纵 检验 有 效 性 不 足 。 其 次 ， 由 于 实验 操纵 与 因 变 量 间 常 存在 
竞争 性 解释 , 管理 心理 实验 操纵 一 般 无 法 精准 激活 , 经 常会 激活 多 个 心理 变量 (Lerche & Voss, 
2018)。 在 存在 竞争 性 解释 的 情况 下 ， 直 接 操 纵 检验 不 仅 无 法 排除 对 构 念 效 度 造成 严重 威胁 
的 竞争 性 解释 , 反而 有 可 能 提升 研究 者 对 研究 结论 的 主观 信心 ， 导致 错误 归 因 进而 提升 犯 第 
二 类 错误 的 概率 ,阻碍 理论 发 展 (Fayant etal.,2017)。 如 果 贸 然 基 于 有 偏 的 操纵 检验 的 结果 认 
定 实验 操纵 成 功 ， 继 而 得 出 自 变 量 与 因 变 量 间 的 因果 关系 ， 这 会 夸大 实验 结果 的 显著 性 


(Lerche & Voss, 2018)。 
3.3.3 操纵 检验 误差 控制 的 应 对 策略 

要 保证 操纵 检验 能 有 效 反映 实验 操纵 的 信息 ， 防 止 无 端 扩 大 研究 者 对 实验 结果 的 信心 ， 
研究 者 需要 进行 严谨 的 实验 设计 ,重点 关注 诸如 操纵 检验 测量 误差 、 被 试 乱 填 、 竞 争 性 解释 
等 问题 ， 尽 可 能 控制 外 生 干 扰 因 素 。 首 先 ， 测量 误差 在 心理 测量 领域 已 受到 广泛 讨论 , 使 用 
成 熟 量 表 是 降低 测量 误差 的 重要 路 径 (Kyriazos & Stalikas, 2018)。 因 此 ， 使 用 自我 报告 式 操 
纵 检验 时 ， 应 尽量 使 用 成 熟 的 多 题 项 量 表 或 者 表述 足够 清晰 有 具体 的 单 题 项 量 表 ( 卫 旭 华 , 张 
亮 花 , 2019)， 以 保证 操纵 检验 能 有 效 反映 所 测 的 变量 。 其 次 ， 被 试 不 认真 填 答 所 产生 的 无 效 
数据 会 导致 操纵 检验 的 结果 失真 , 无 法 有 效 反映 实验 的 真实 情况 影响 其 有 效 性 。 由 于 操纵 检 
验 的 主观 性 , 操纵 检验 的 填 答 结 果 不 能 作为 排除 无 效 被 试 的 证 据 , 而 具有 客观 答案 的 指导 式 
操纵 检验 是 排除 不 认真 填 答 样本 的 最 佳 方法 (Abbey & Meloy, 2017)。 最 后 ， 研 究 者 可 以 使 用 
辨别 式 操 纵 检验 排除 竞争 解释 (Ejel6v & Luke, 2020)。 辨 别 式 操 纵 检验 需要 提前 分 析 实 验 操 
纵 引 发 的 竞争 性 解释 ， 并 在 操纵 检验 中 测量 这 些 变 量 , 分 析 时 将 其 控制 ， 最终 达到 排除 额外 
解释 的 目的 。 在 假设 检验 过 程 中 ,辨别 式 操纵 检验 可 以 将 所 测量 的 竞争 性 因素 控制 ,进而 验 
证 自 变量 对 因 变 量 独特 的 解释 力 (Lerche & Voss, 2018)。 
3.4 操纵 检验 位 置 设计 的 现状 、 问 题 与 应 对 策略 
3.4.1 操纵 检验 位 置 设计 的 现状 

操纵 检验 位 置 设计 也 是 实验 施 过 程 中 的 关键 环节 ,我 们 对 自我 报告 式 操纵 检验 的 实施 位 


置 进 行 了 统计 分 析 。 结 果 显 示 ， 在 实施 操纵 检验 的 113 项 实验 中 ， 有 75% 的 实验 C85 项) 
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将 操纵 检验 置 于 因 变 量 测量 前 ， 即 在 完成 实验 操纵 后 ， 进 行 操 纵 检 验 ; 而 仅 有 15% 的 实验 
(18 项 ) 将 操纵 检验 设 于 因 变 量 测量 后 ; 另外， 有 10 项 实验 并 未 明确 提 及 操纵 检验 在 实验 
中 所 处 的 位 置 。 但 遗憾 的 是 ， 这 些 实验 没有 具体 讨论 操纵 检验 的 放置 理由 。 
3.4.2 操纵 检验 位 置 设计 的 问题 

无 论 是 国内 还 是 国外 管理 心理 领域 的 实验 研究 , 只 有 部 分 学 者 注意 到 操纵 检验 位 置 对 实 
验 的 影响 ， 且 具体 处 理 措施 较为 简单 ,没有 讨论 操纵 检验 位 置 与 实验 操纵 的 具体 关系 。 事实 
E, 操纵 检验 置 于 因 变 量 前 是 其 干扰 实验 进程 的 重要 原因 之 一 。 操纵 检验 题 项 一 般 具 有 强 暗 
示 性 ,将 其 放置 在 因 变 量 前 会 使 被 试 猜测 实验 目的 ， 对 实验 信息 进一步 加 工 ， 进 而 影响 后 续 
的 反应 策略 (Hauser & Schwarz, 2015)。 基 于 此 ， 不 少 研究 为 减 小 操纵 检验 的 干扰 ， 开 始 将 其 
放置 在 因 变 量 测量 之 后 。 然 而,， 这 种 方式 的 可 行 性 也 受到 质疑 。 管理 心理 实验 一 般 操纵 的 是 
短期 心理 状态 , 操纵 对 被 试 的 影响 时 间 较 短 , 放置 在 因 变 量 后 可 能 会 导致 操纵 检验 效力 下 降 
(Hoprekstad et al., 2019). 


3.4.3 操纵 检验 位 置 设计 的 应 对 策略 
研究 者 可 以 根据 操纵 检验 与 实验 操纵 的 关系 、 实 验 操纵 持续 时 间 等 因素 来 决定 操纵 检验 


的 位 置 (Chester & Lasko, 2021)。 一 方面 ， 从 操纵 检验 与 实验 操纵 的 关系 来 看 ， 当 操纵 检验 对 
实验 操纵 无 负面 影响 甚至 有 积极 影响 时 〈 比 如 客观 情境 或 角色 信息 的 操纵 )， 可 以 将 其 放置 
在 因 变 量 之 前 。 在 一 些 角色 扮演 的 情景 实验 中 , 置 于 因 变 量 前 的 操纵 检验 可 以 加 强 被 试 对 实 
验 操纵 情境 的 回忆 和 感知 ， 有 助 于 验证 自 变量 与 因 变 量 间 的 因果 关系 。 然 而 ， 当 操纵 检验 对 
实验 操纵 有 消极 影响 时 (比如 不 能 暴露 实验 目标 的 实验 )， 研 究 者 可 以 将 操纵 检验 材料 置 于 
因 变 量 之 后 ， 从 而 避免 暴露 实验 目标 并 减少 被 试 对 实验 目的 的 猜测 。 另 一 方面 ， 从 实验 操纵 
的 持续 时 间 来 看 ， 当 实验 操纵 持续 时 间 较 短 时 〈 比 如 情绪 类 的 操纵 )， 操 纵 检验 应 当 置 于 因 
变量 前 ， 从 而 能 够 避免 操纵 检验 后 置 带 来 的 效力 下 降 问 题 。 然 而 ， 当 操纵 检验 对 实验 操纵 有 
负面 影响 ， 且 操纵 持续 效果 较 长 时 《比如 一 些 非 情绪 类 的 操纵 )， 研 究 者 可 以 考虑 将 操纵 检 
验 后 置 ， 避 免 操纵 检验 对 实验 操纵 的 潜在 干扰 。 最 后 ， 当 操纵 检验 对 实验 操纵 有 负面 影响 ， 
且 实 验 操纵 持续 效果 较 短 时 ， 前 置 型 操纵 检验 会 产生 干扰 被 试 的 问题 ， 后 置 型 操纵 检验 会 产 
生 检 验 效力 不 足 的 问题 ， 此 时 可 以 通过 预 实验 检验 实验 操纵 的 有 效 性 。 

3.5 操纵 检验 实施 时 机 的 现状 、 问 题 与 应 对 策略 

3.5.1 操纵 检验 实施 时 机 的 现状 

操纵 检验 可 以 在 实验 前 、 实 验 中 和 实验 后 开展 。 实验 前 的 操纵 检验 通常 是 通过 预 实验 的 


形式 展开 , 而 实验 后 的 操纵 检验 则 通常 是 对 实验 过 程 中 产生 的 文本 、 音 频 和 视频 材料 进行 事 
后 编码 (李小平 等 ,2014)。 我 们 对 操纵 检验 实验 的 实施 时 机 做 了 统计 ， 结 果 显 示 ， 在 113 项 


= 


c 


实施 操纵 检验 的 实验 中 ， 共 有 16 项 实验 在 实验 前 通过 预 实验 的 形式 开展 操纵 检验 ， 有 2 项 
研究 在 实验 后 通过 定性 编码 的 形式 开展 操纵 检验 。 除 此 之 外 ,我 们 还 发 现 , 绝 大 多 数 采用 事 
前 或 者 事后 操纵 检验 的 实验 研究 对 实验 设计 过 程 和 检验 结果 的 报告 较为 简略 , 有 些 研究 甚至 
没有 报告 预 实验 基本 样本 信息 和 操纵 检验 组 间 差 异 分 析 结 果 。 
3.5.2 操纵 检验 实施 时 机 的 问题 

不 同 实施 时 机 的 操纵 检验 会 给 实验 进程 带 来 不 同 程度 的 影响 。 首先 , 为 了 减少 对 正式 实 
验 进程 的 干扰 , 不 少 西方 学 者 建议 使 用 预 实验 , 即 在 正式 实验 开始 之 前 单独 对 操纵 有 效 性 进 
行 实验 验证 (Chester & Lasko, 2021; Ejelóv & Luke, 2020; Hauser et al., 2018; Wilson et al., 2010). 
预 实验 不 会 对 正式 实验 进程 产生 干扰 ， 且 能 为 实验 操纵 的 有 效 性 提供 证 据 。 除 此 之 外 , 它 也 
可 以 让 研究 者 以 较 低 成 本 发 现 和 改进 实验 操纵 中 的 问题 ， 最 终 达 到 有 效 操纵 的 目的 。 然 而 ， 
预 实验 法 也 有 其 自身 的 局 限 性 。 预 实验 的 基本 逻辑 是 该 操纵 在 预 实验 中 达到 了 预期 效果 ， 那 
么 就 可 以 预期 在 正式 实验 中 也 能 激活 相应 的 心理 状态 。 如 果 预 实验 与 正式 实验 的 被 试 具 有 明 
显 异 质 性 , 或 者 预 实验 与 正式 实验 实施 的 情景 具有 明显 差异 时 ， 预 实验 经 验 推广 到 正式 实验 
就 会 受到 挑战 。 其 次 ， 前 文 统计 结果 表明 ， 研 究 者 普遍 在 实验 进程 中 实施 操纵 检验 。 然 而 ， 
前 文 已 经 指出 , 绝 大 多 数 管理 心理 实验 将 操纵 检验 置 于 因 变 量 之 前 , 这 可 能 会 暴露 实验 目标 ， 
并 对 实验 进程 产生 干扰 。 最 后 ,在 实验 结束 后 实施 操纵 检验 时 ， 如 果 收 集 到 的 用 于 操纵 检验 
的 文本 、 音 频 和 视频 材料 有 缺失 ， 研 究 者 将 无 法 进行 正确 的 编码 。 此 外 ， 编 码 者 自身 的 素质 
也 可 能 会 对 事后 操纵 检验 效果 产生 较 大 的 影响 。 
3.5.3. 操纵 检验 实施 时 机 的 应 对 策略 

针对 不 同 实施 时 机 操纵 检验 的 特点 ， 研 究 者 应 当 采 取 不 同 的 应 对 策略 。 首 先 ,， 在 采用 预 
实验 方式 开展 操纵 检验 时 , 研究 者 需要 尽 可 能 保证 预 实验 与 正式 实验 在 参与 对 象 和 实验 环境 
的 同 质 性 , 并 在 正式 实验 中 通过 指导 式 操 纵 检验 等 方式 保证 被 试 认真 填 答 (Hauser & Schwarz, 
2015)。 其 次 ， 在 正式 实验 中 开展 操纵 检验 时 ， 研 究 者 应 当 将 可 能 会 对 实验 进程 产生 潜在 干 
扰 的 操纵 检验 材料 放 在 因 变 量 之 后 ， 以 减少 其 对 实验 结果 的 影响 。 最 后 ,在 采用 事后 检验 的 
方式 开展 操纵 检验 时 ， 研 究 者 应 当 确保 文本 、 音 频 和 视频 材料 的 完备 性 ， 增 强 编码 者 的 专业 
性 ， 从 而 减少 由 于 数据 缺失 或 者 编码 者 素质 对 操纵 检验 结果 的 影响 。 
3.6 操纵 检验 分 析 策 略 的 现状 、 问 题 与 应 对 策略 
3.6.1 操纵 检验 分 析 策 略 的 现状 

操纵 检验 结果 涉及 丰富 的 实验 数据 ,通过 有 效 的 分 析 方 法 提取 这 些 数 据 中 与 实验 相关 的 
言 息 能 有 效 提高 操纵 检验 的 利用 率 (Ejel6v & Luke, 2020; Lench et al., 2014)， 这 也 可 以 为 操纵 


有 效 性 提供 更 有 力 的 证 据 。 结果 显示 ,几乎 所 有 使 用 操纵 检验 的 实验 均 报 告 了 预期 操纵 变量 


的 组 间 方 差分 析 结 果 以 证 明 操 纵 有 效 ， 有 个 别 实验 仅 对 操纵 检验 过 程 进行 了 定性 描述 , 未 报 


告 分 析 结果 。 当 前 国内 外 3 


流 管理 心理 实验 仅仅 把 操纵 检验 作为 验证 实验 操纵 有 效 的 手段 ， 


却 忽视 了 对 实验 操纵 强度 、 实 验 操 纵 检验 在 实验 操纵 与 因 变量 关系 方面 的 探索 ,对 管理 心理 
实验 中 操纵 检验 数据 的 利用 率 较 低 。 
3.6.2 操纵 检验 分 析 策 略 的 问题 


因 变 量变 化 ”外 扫 


高 权力 、 低 权力 )， 如 果 研 究 者 实施 了 非 


对 于 实验 研究 而 言 ， 操 纵 强 度 与 因 变 量 效应 间 的 关系 具有 重要 意义 。“ 弱 操纵 导致 的 强 
到 现实 情景 中 的 可 能 性 显然 高 于 “ 强 操纵 导致 的 弱 因 变量 变化 (Prentice & 
Miller, 1992)。 由 于 实验 研究 的 操纵 通常 是 将 自 变 量 的 两 种 较为 极端 的 情形 展示 了 出 来 (如 

常 强 的 操纵 效应 ， 仅 得 到 了 显著 但 效应 量 较 小 的 因 


变量 变化 ,实验 结果 的 稳健 性 和 外 部 效 度 可 能 会 面临 较 大 的 质疑 。 此 外 ， 对 于 那些 将 操纵 检 


验 置 于 


题 项 与 


因 变 量 前 的 实验 而 言 ， 如 果 操纵 检验 显著 ,操纵 对 因 变 量 的 影响 也 显著 , 但 操纵 检验 
因 变 量 的 关系 不 显著 , 则 实验 的 结论 也 可 能 会 面临 一 些 挑 战 。 这 意味 着 研究 应 当 检 验 


“操纵 -操纵 检验 - 因 变 量 ” 之 间 的 中 介 效 应 ， 从 而 确保 操纵 对 因 变 量 的 影响 的 确 是 通过 研究 


者 预期 的 机 


By 


所 发 生 的 (Lench etal., 2014)。 然 而 ， 目 前 从 实验 操纵 强度 和 操纵 中 介 分 析 角 度 挖 


掘 操纵 检验 数据 的 研究 并 不 多 见 。 


3.6.3 操纵 检验 分 析 策 略 的 应 对 策略 


入 解读 ， 即 计算 


la 


由 于 操纵 检验 具有 体现 实验 操纵 强度 的 特 怡 
强度 进行 分 析 。Ejel6v 和 Luke (2020) 提出 可 以 利 月 


E 


CN: 


Ui 


FE, 研究 者 可 以 利用 操纵 检验 数据 对 实验 操纵 


[均值 差 、 标准化 均值 差 (Cohen’s d)。 低 、 中 、 


因果 效率 分 析 对 实验 设计 和 结果 进行 深 
办 变量 组 间 差 异 程度 /操纵 检验 组 间 差 异 程度 。 这 里 的 组 间 差 蜡 程度 指 效 应 


高 因果 效率 基准 点 分 别 为 0.09、0.34、 


0.86， 其 得 分 越 高 代表 实验 结果 的 外 部 效 度 更 高 (Ejel6v & Luke, 2020)。 除 此 之 外 ， 对 操纵 检 


验 数 据 的 分 析 也 可 以 为 实验 者 提供 更 多 的 实验 细节 ,| 
因此 ， 在 实验 结果 分 析 阶 段 ， 研 究 者 可 以 
借助 实验 强度 分 析 展 现 更 多 实验 细节 (Schiifer & Schwarz, 2019). 

男 一 方面 , 操纵 检验 可 以 视 为 实验 操纵 与 因 变 量 


力 的 因果 推断 (Fiedler et al., 2011; Hauser et al., 2018; Lench et al., 2014)。 传 统 实验 数据 分 析 仅 


导致 的 实验 结果 不 显著 (Schwarz & Strack, 2014). 


司 时 还 可 以 有 效 避 免 因 操纵 强度 不 足 而 


间 的 中 介 , 可 以 通过 中 介 分 析 得 出 更 有 


仅 检验 实验 操纵 对 因 变 量 的 影响 , 却 忽视 了 实验 操纵 首先 会 引发 被 试 心理 层面 的 变化 , 进而 


对 因 变 量 产 


影响 。 被 试 心理 层面 的 变化 包含 两 层 含义 , 即 实验 操纵 既 可 以 引发 被 试 在 直接 


操纵 检验 层面 的 变化 ， 也 可 以 引发 直接 操纵 检验 之 外 竞争 性 因素 的 变化 (Lench et al., 2014). 
比如 在 上 文 牙膏 和 电脑 的 实验 操纵 例子 中 ， 不 同 产品 既 可 以 触发 被 试 不 同 的 风险 感知 水 平 


(操纵 检验 作为 中 介 )， 也 可 以 触发 被 试 不 同 的 价格 感知 水 平 (竞争 性 解释 作为 中 介 )， 进 而 
对 产品 选择 偏好 产生 影响 ( 刘 咏 梅 等 , 2015)。 

综 上 所 述 ， 本 研究 对 国内 管理 心理 实验 操纵 检验 实施 形式 、 误 差 控制 、 位 置 设计 
时 机 、 分 析 策 略 等 关键 设计 环节 的 使 用 现状 、 问 题 及 其 应 对 策略 进行 了 系统 梳理 ， 有 具体 总 结 


将 
= 


的 内 容 如 表 2 所 示 。 
表 2 国内 管理 心理 实验 操纵 检验 的 现状 、 问 题 与 应 对 策略 
关键 环节 使 用 现状 存在 的 问题 应 对 策略 
自我 报告 式 操纵 检验 可 能 外 部 观察 或 客观 指 
国内 操纵 检验 实施 形式 单一 ， 以 d E A th 
实施 形式 A 引发 被 试 对 实验 目的 的 解读 标 等 低 干预 性 操纵 检验 
自我 报告 为 主 


和 思考 ， 干 扰 实验 进程 


采用 成 熟 多 题 项 量 
仍 有 相当 比例 研究 未 使 用 成 熟 量 。 单一 或 不 成 熟 的 操纵 检验 题 ”或 者 使 用 表述 足够 具体 
表 ， 未 使 用 辨别 式 操纵 检验 排除 。 项 和 被 试 不 认真 填 答 会 引发 ” 且 清 晰 的 单 题 项 量 表 ， 
误差 控制 ”竞争 性 解释 ， 且 使 用 指导 式 操 纵 — 测量 误差 ,竞争 性 解释 会 引 引入 规范 的 无 效 样本 排 
检验 等 新 兴 操 纵 检 验 策略 排除 无 。 发 系统 误差 ， 进 而 产生 有 偏 ” 除 策略 (如 指导 式 操纵 
效 样本 的 比例 较 低 的 实验 结论 检验 )， 使 用 辨别 式 操 
纵 检验 排除 竞争 解释 
若 操 纵 检验 对 实验 结果 


只 有 部 分 学 者 注意 到 操纵 检验 位 ”操纵 检验 前 置 会 引发 被 试 反 


无 负面 影响 ， 可 放 因 变 
位 置 设计 。” 置 对 实验 的 影响 ， 多 数 实验 将 操 ” 思 和 猜测 实验 目的 ， 干 扰 实 = ee 
纵 检验 置 于 因 变 量 前 E, RMR em D 
在 实验 过 程 中 开展 操纵 检验 ”事前 操纵 检验 需要 保证 
多 数 实验 是 在 实验 过 程 中 完成 操 会 干扰 实验 进程 ， 预 实验 中 预 实验 与 正式 实验 在 参 
auge, 级 检验 ， 通 过 实验 前 的 预 实验 形 。 操纵 成 功 并 不 代表 正式 实验 与 对 象 和 实验 环境 的 同 
式 或 者 实验 后 的 定性 编码 形式 开 — 也 成 立 ， 实 验 后 开展 操纵 检 质 性 ， 事 后 操纵 检验 需 
展 操纵 检验 的 比例 较 低 验 受过 程 材料 完备 度 和 编码 ”要 保证 过 程 材料 的 完整 
者 的 影响 性 和 编码 者 的 素质 
操纵 检验 方差 分 析 并 不 能 保 
操纵 检验 数据 的 使 用 率 较 低 ， 仅 ce Rond 利用 操纵 强度 分 析 、 操 
WE SES. Hb ^ EF ‘AG 
分 析 策略 限于 自 变量 组 间 方 差分 析 ， 忽 视 。 oe 通过 启动 预期 纵 中 介 分 析 等 新 方法 分 
MESE BRA Fi a JINA 
了 实验 操纵 强度 、 操 纵 中 介 分 析 Md DRM y 。 析 操 纵 检验 数据 ， 为 实 
AUN A dn] SI A EE ZI S 区 
等 分 析 策 略 验 提 供 更 翔实 的 证 据 
i 不 能 保证 不 存在 竞争 性 解释 


4 结论 与 建议 


4.1 结论 

通过 对 国内 管理 心理 领域 4 本 权威 期 刊 中 144 项 实验 的 编码 分 析 ， 本 研究 发 现 国内 管 
理 心理 实验 研究 虽然 对 操纵 检验 的 重视 度 较 高 , 但 在 具体 使 用 中 , 操纵 检验 多 以 自我 报告 的 
自 变 量 测量 展开 , 使 用 辨别 式 操纵 检验 排除 竞争 性 解释 和 使 用 指导 式 操纵 检验 排除 无 效 样本 


的 实验 比例 还 比较 低 。 此 外 ,多数 实验 将 操纵 检验 置 于 因 变 量 前 ， 而 较 少 考虑 开展 实验 前 和 
实验 后 的 操纵 检验 形式 , 且 很 少 有 研究 借助 操纵 强度 分 析 和 操纵 中 介 分 析 策略 挖 气 操 纵 检验 
数据 。 总 体 来 看 ,操纵 检验 在 国内 管理 心理 实验 领域 实际 使 用 中 存在 诸多 问题 ， 日 趋 完善 的 
操纵 检验 方法 并 未 有 效应 用 到 管理 心理 实验 中 。 
4.2 操纵 检验 使 用 建议 

不 规范 的 操纵 检验 无 法 有 效 保证 实验 构 念 效 度 ， 甚至 可 能 会 影响 实验 进程 、 得 出 错误 结 
论 。 因 此 ， 解 答 如 何 规范 使 用 操纵 检验 至 关 重 要 。 国 内 实验 研究 多 采用 单一 途径 检验 操纵 有 
效 性 ， 注 重 直 接 操纵 检验 ， 而 忽视 了 其 他 检验 途径 。 事 实 上 ， 各 类 操纵 检验 能 在 不 同方 面 保 
证 实验 操纵 有 效 ， 因 此 研究 者 应 综合 考虑 实验 操纵 特点 和 检验 方式 作用 进行 多 途径 检验 。 
4.2.1 通过 非 干预 形式 减少 操纵 检验 对 实验 进程 的 干扰 
国内 绝 大 多 数 实验 研究 采用 了 自我 报告 式 的 操纵 检验 , 很 少 讨论 操纵 检验 对 实验 进程 的 
潜在 干扰 。 其实， 很 多 实验 操纵 可 以 通过 诸如 视频 观察 、 行 为 编码 、 生 理 测量 、 客 观 指标 等 
非 自我 报告 的 形式 进行 检验 ,这 类 非 干预 的 操纵 检验 形式 对 实验 干扰 较 小 。 因此， 研究 者 在 
N 使 用 自我 报告 检验 形式 时 , 需 提前 论证 操纵 检验 是 否 会 对 实验 进程 产生 影响 以 及 如 何 规避 访 
= 影响 的 问题 。 与 此 同时 ， 研 究 者 应 尽量 选择 低 干预 性 的 操纵 检验 形式 。 
c 4.2.2 实施 误差 控制 策略 排除 无 效 检验 和 竞争 性 解释 
国内 实验 对 操纵 检验 结果 误差 的 重视 度 不 足 ,样本 中 近 一 半 的 研究 未 采用 成 熟 的 测量 方 
R, 大 部 分 研究 并 未 使 用 规范 的 样本 排除 和 竞争 性 解释 排除 策略 。 因 此 ,研究 者 需要 采取 措 
施 控 制 操纵 检验 结果 误差 。 首 先 ， 研 究 者 需 使 用 成 熟 量 表 进 行 操纵 检验 测量 ， 以 降低 测量 误 
差 。 如 果 研 究 者 使 用 单 题 项 进行 操纵 检验 ， 需 要 确保 单 题 项 的 表述 足够 具体 且 清 晰 ( 卫 烛 华 , 
张 亮 花 , 2019)。 其 次 ， 如 果 在 实验 过 程 中 不 能 对 被 试 进行 严格 的 控制 ， 就 需要 采取 诸如 指导 
式 操纵 检验 等 方式 排除 无 效 数据 ， 保 证 纳入 分 析 的 数据 均 为 被 试 认真 填 答 的 结果 (Abbey & 
Meloy, 2017)。 最 后 ， 目 前 被 学 者 们 广 为 采 纳 的 直接 操纵 检验 无 法 排除 实验 操纵 与 因 变 量 之 
间 存 在 系统 误差 和 竞争 性 解释 .除非 研究 者 们 能 通过 理论 推演 证 明 实验 操纵 与 因 变 量 间 没 有 
竞争 性 解释 , 否则 有 必要 在 实验 中 测量 重要 的 竞争 性 解释 ,以 证 明 自 变量 对 因 变 量 独 特 的 影 


= 


Il] (Ejelóv & Luke, 2020; Lerche & Voss, 2018). 
4.2.3 根据 操纵 检验 特性 决定 其 在 实验 材料 中 的 位 置 

当 使 用 自我 报告 式 操纵 检验 时 , 研究 者 还 需要 注意 操纵 检验 的 位 置 。 国内 外 不 少 实验 研 
究 将 操纵 检验 置 于 因 变 量 前 , 这 可 能 会 对 因 变 量 产 生 潜 在 的 干扰 作用 。 然而， 如 果实 验 问卷 
很 长 , 而 实验 操纵 的 持续 时 间 很 短 , 将 操纵 检验 置 于 因 变 量 之 后 又 可 能 会 导致 操纵 检验 无 效 


的 问题 。 这 意味 着 , 研究 者 应 当 根 据 操纵 检验 与 实验 操纵 的 关系 以 及 实验 操纵 持续 时 间 等 特 
性 来 判断 操纵 检验 在 实验 材料 中 的 位 置 。 如 果 操 纵 检验 会 对 实验 操纵 和 因 变 量 产生 负面 干 
W, 就 需要 将 其 放 于 因 变 量 后 测量 , 反之 则 可 以 放置 于 因 变 量 前 (Hauseret al.,2018)。 如 果实 
验 操纵 持续 时 间 较 短 ， 需 要 将 操纵 检验 置 于 因 变量 前 ， 反 之 则 可 以 置 于 因 变量 后 。 
4.2.4 借助 事前 和 事后 操纵 检验 实现 操纵 时 机 的 灵活 性 
当前 国内 外 研究 者 多 在 实验 过 程 中 实施 操纵 检验 , 忽视 了 在 其 他 时 机 开展 操纵 检验 的 潜 
在 好 处 。 一 方面 ， 操 纵 检 验 可 以 通过 预 实验 的 形式 在 实验 前 实施 ， 其 主要 有 两 种 应 用 情境 。 
首先 ， 如 果 操 纵 检 验 对 操纵 和 因 变 量具 有 潜在 负面 干扰 (不 能 置 于 因 变量 前 )， 且 实验 操纵 
的 持续 时 间 较 短 时 (不 能 置 于 因 变 量 后 ), 就 需要 提前 进行 预 实验 论证 操纵 的 有 效 性 (Chester 
& Lasko, 2021)。 其 次 ， 如 果实 验 操纵 是 针对 特定 实验 目的 而 原创 或 改编 ， 就 必须 进行 预 实 
验 ， 论 证 操纵 的 合法 性 。 值 得 注意 的 是 ,在 预 实验 中 不 能 单独 依靠 定量 的 方式 检验 操纵 有 效 
性 ， 有 必要 在 预 实验 结束 后 对 被 试 进行 定性 访谈 , 询问 被 试 在 实验 中 的 感受 , 发 现 竞争 性 解 
FE, 方便 在 正式 实验 中 进行 控制 。 另 一 方面 , 如 果实 验 者 在 实验 过 程 中 通过 录入 文本 、 音 频 、 
视频 等 形式 开展 实验 操纵 , 研究 者 完全 可 以 邀请 有 经 验 的 定性 编码 者 对 这 些 操纵 过 程 进 行事 
后 检验 ， 进 而 降低 对 实验 进程 的 干扰 。 研 究 者 可 以 结合 自身 实验 设计 的 特点 灵活 采用 事前 、 
事 中 和 事后 操纵 检验 。 
4.1.5 开展 操纵 强度 和 中 介 分 析 提 升 实验 内 外 部 效 度 
国外 方法 类 学 者 已 经 开始 强调 对 操纵 检验 数据 深度 利用 , 而 国内 实验 研究 对 操纵 检验 数 
据 的 利用 率 较 低 ， 少 有 研究 基于 检验 数据 采用 前 沿 方法 展现 实验 细节 。 一 方面 ,研究 者 可 以 
rr 通过 操纵 强度 分 析 (Schifer & Schwarz, 2019)， 计 算 实验 的 因果 效率 ( 因 变量 组 间 差 异 除 以 操 
纵 检验 组 间 差异 )， 探 究 实 验 结果 的 外 部 效 度 。 另 一 方面 ， 研 究 者 还 可 以 通过 将 “操纵 -操纵 
仿 验 - 因 变 量 ” 的 中 介 效 应 分 析 方法 证 实 实验 操纵 的 确 是 由 预期 的 操纵 机 制 实现 的 ， 排 除 竞 
争 性 假设 ， 为 实验 结论 提供 更 强 的 因果 证 据 ， 提 升 实验 的 内 部 效 度 (Lench et al., 2014)。 
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Manipulation checks in the managerial psychology experiment in 
China: Current status, problems, and suggestions 


WEI Xuhua, WANG Guangwei, CHEN Yi 
(School of Management, Lanzhou University, Lanzhou 730000, China) 
Abstract: Manipulation checks are important to ensure the construct validity of experiment, 
however, they have been less discussed in Chinese managerial psychology research. To investigate 
the status quo of manipulation checks among Chinese studies, we coded 144 experiments drawn 
from 49 research in the field of managerial psychology which were published in 4 top-tier journals 
in 2020 (i.e., Acta Psychologica Sinica, Journal of Psychological Science, Management World, and 
Nankai Business Review). We found that among these experiments, the way to implement 
manipulation checks appeared monistic with self-report dominating. And very few experiments 
focused on discriminant manipulation checks or instructional manipulation checks. In addition, the 
choice of location, the time to implement, and the strategy of analysis remained underexplored. 
Future research should pay attention to the application of non-interventional forms to reduce the 
interference of manipulation checks on the experimental process. Besides, error control strategies 
should be advocated to eliminate invalid data and competitive explanations. At the same time, we 
suggest that researchers should consider the characteristics of manipulation checks when they 
decide the appropriate position of manipulation checks included in the experiment material. 
Researchers are also encouraged to use pre and post manipulation checks to ensure flexibility. In 
the data analysis phase, we recommend researchers use manipulation strength and mediation 
analysis to guarantee the internal and external validity of the experiment. By doing so, we expect 


the normativity of manipulation checks will be improved to a great extent. 


Keywords: managerial psychology experiment, direct manipulation checks, discriminant 


manipulation checks, instructional manipulation checks 


